I- Introduction
Les lymphocytes B représentent environ 5 à 15% des lymphocytes circulants et sont classiquement définis par la présence d’immunoglobulines de surface. Ces immunoglobulines sont produites par la cellule elle-même. Elles jouent le rôle de récepteur spécifique pour l’antigène (BcR : B cell receptor). La majorité des cellules B périphériques humaines expriment à leur surface des Ig de deux classes, IgM et IgD. Sur la même cellule, ces immunoglobulines d’isotypes différents possèdent les mêmes sites anticorps. Dans le sang, très peu de cellules expriment des IgG, des IgA ou des IgE de surface, mais on détecte un grand nombre de ces cellules dans certains sites spécifiques (cellules à IgA dans l’intestin par exemple). Le BcR est associé à des molécules responsables de la transduction du signal après contact avec l’antigène, les chaînes Iga et Igb. Parmi les autres marqueurs présents à la surface du lymphocyte B on note les antigènes de classe II du CMH qui interviennent dans la présentation des antigènes aux lymphocytes T, les récepteurs du C3b et du C3d du complément, et les marqueurs CD19, CD21, CD81 et CD45 qui jouent un rôle dans l’activation du lymphocyte B. La molécule CD5, exprimée par les cellules T, est aussi retrouvée sur une sous-population de lymphocytes B : les lymphocytes B-1a. Ces lymphocytes B1-a, pratiquement absents du sang périphérique, sont retrouvés majoritairement dans les cavités pleurale et péritonéale. Ils sont responsables de la production des auto-anticorps naturels.
II – Le récepteur de l’antigène des lymphocytes B
A-
Génération du répertoire B : diversité des Ig de membrane du lymphocyte B
La reconnaissance spécifique de l’antigène est la caractéristique de la réponse immunitaire adaptative.
Deux molécules sont impliquées dans ce processus
1. Le récepteur de l’antigène des lymphocytes T (TcR).
2. Les Immunoglobulines (Ig) des lymphocytes B.
Figure 1 : Structure du récepteur de
l’antigène des lymphocytes B.
Ces deux familles de molécules sont caractérisées par leur diversité et leur variabilité, produits des recombinaisons des gènes codant les chaînes des récepteurs de l’antigène.
Le nombre élevé d’antigènes susceptibles d’être rencontrés par l’organisme implique que le système génétique doit permettre la synthèse d’au moins plusieurs millions de molécules différentes, dont une partie (partie constante) est absolument invariable à l’acide aminé près, et dont l’autre partie doit être variable et spécifique d’un ligand (motif antigénique : épitope). Celui-ci peut être totalement synthétique et n’avoir jamais existé dans la nature. Plusieurs immunoglobulines peuvent avoir des parties variables identiques et des parties constantes différentes : IgM et IgD de surface ou passage des IgM au IgG sans changement de spécificité (switch ou commutation isotypique). Le système doit être stable et posséder une mémoire permettant la réactivation de la synthèse d’immunoglobulines à spécificité identique plusieurs dizaines d’années plus tard. Une même cellule ne peut synthétiser qu’un seul type d’anticorps malgré la présence de deux chromosomes (exclusion allélique)
La diversité des anticorps résulte en premier lieu de recombinaisons génétiques au niveau somatique entre des gènes codant les parties variables et le gène codant la partie constante.
B – Diversité combinatoire
B-1-Organisation
des gènes codant les chaînes légères d’immunoglobulines
B-1-1
Chaînes Kappa
Figure
2 : Organisation
des gènes codant les chaînes légères Kappa
L'ensemble des gènes présidant à la synthèse des chaînes
kappa est, chez l'homme, situé sur le chromosome 2. La synthèse d'une chaîne
kappa nécessite l'intervention de trois gènes, un gène V ou gène variable, un
gène J ou gène de jonction et le gène C ou gène de la partie constante. Ces
domaines sont organisés dans cet ordre aussi bien sur le chromosome que dans la
chaîne polypeptidique.
L'homme possède environ 300 gènes Vk. Chacun est précédé par une courte séquence, la séquence leader (L), séparée du gène V proprement dit par un court intron. Cette séquence leader code le peptide signal qui indique à la cellule que la chaîne polypeptidique doit être sécrétée. L'intron est excisé lors de la maturation du mRNA.
Les gènes J sont au nombre de 5, et sont constitués chacun d'environ 39 paires de bases. Le groupe des 5 gènes J s'étend sur 500 à 700 paires de bases. Ce groupe de gènes J est situé quelques centaines de kb en aval du groupe des gènes V, et 2 à 3 kb en amont du gène C. Enfin le groupe de gènes des chaînes kappa se termine par l'unique gène C qui ne contient pas d'intron.
Le gène recombiné est transcrit en mRNA dont la maturation va conduire à l'excision de l'intron entre la séquence leader et le gène V et de l'intron qui sépare le gène J choisi et le gène C. Le messager est traduit en un polypeptide qui perd son peptide signal lors de la sécrétion.
La formation
d'un gène kappa fonctionnel résulte d'une recombinaison entre un gène V et un
gène J
En utilisant la technique de Southern, l'équipe de
Tonegawa montra que le gène V est plus éloigné du gène C dans les cellules
germinales qu'il ne l'est dans les cellules sécrétantes (il s'agissait en
l'occurrence de cellules d'un myélome de souris). Au cours de la maturation du
lymphocyte pré-B une recombinaison met bout à bout l'extrémité 3' d'un gène
variable pris au hasard et l’extrémité 5' de l'un des 5 gènes J lui aussi pris
au hasard. Le DNA qui séparait ces deux points avant la recombinaison est
éliminé.
Par ce mécanisme le gène variable est rapproché du gène C
; le complexe V-J n'en est plus séparé que par un intron de 2 à 3 kb. Cet
intron sera éliminé par épissage lors de la maturation du mRNA.
La
recombinaison met en jeu des séquences spécifiques : le complexe
Heptamère-Nonamère
La recombinaison V/J s’explique par l’existence de
séquences complémentaires. Ces séquences sont constituées d’un heptamère et
d’un nonamère séparés par 23 paires de bases immédiatement en 3’ du gène V et
par 12 paires de bases immédiatement en 5’ du gène J. Les deux heptamères et
les deux nonamères s’associent ce qui a pour effet de mettre exactement bout à
bout les gènes V et J. Une recombinase qui reconnaît ce motif assure la
ligation des gènes V et J.
Figure 3: le complexe Heptamère-Nonamère
La recombinaison fait appel aux produits de deux gènes, RAG-1 et RAG-2 qui agissent en synergie
La recherche de la recombinase effectuant les différentes
recombinaisons a permis de cloner l’ADN complémentaire d'un gène qui fut appelé
RAG-1 (pour recombination activating gene). Ce gène n'est exprimé
que dans les cellules de la lignée lymphoïde, il est très conservé dans toutes
les espèces. Des expériences de transfection dans des fibroblastes ont montré
que la protéine codée par cet ADNc n'activait les recombinaisons VDJ qu'avec
une efficacité particulièrement faible, ce qui laissait supposer qu'un autre
facteur était nécessaire. La co-transfection de RAG-1 et d'un autre gène qui
lui est proche sur l’ADN (situé à 8 kb), le gène RAG-2, permet
d'obtenir une activité de recombinaison normale. Le produit du gène RAG-2
exacerbe d'un facteur 1000 l'activité de RAG-1. Le gène RAG-2 est lui aussi
très conservé dans les différentes espèces, mais il ne présente aucune
homologie de structure avec RAG-1. Ces gènes semblent dépourvus d'intron, les
masses moléculaires des protéines codées par RAG-1 et RAG-2 sont respectivement
de 55 et 58 kDa.
B-1-2
Chaînes lambda.
Le modèle des chaînes lambda est proche de celui des chaînes kappa
L'ensemble des gènes codant les chaînes lambda sont, chez l'homme, situés sur le chromosome 22.
Les mécanismes qui président à la synthèse et à la diversité des chaînes lambda sont identiques à ceux décrits pour les chaînes kappa. Seuls l'organisation et le nombre des gènes sont différents. La différence porte sur l'organisation des gènes J et le nombre des gènes constants.
Il
existe au moins 6 gènes C différents, chacun étant précédé d’un seul gène J qui
lui est propre. La recombinaison se fait au hasard entre l'un des gènes V et le
gène J de l'un des 6 complexes J/C.
Figure
4 : Organisation
des gènes codant les chaînes légères Lambda
B-2-Organisation
des gènes codant les chaînes lourdes d’immunoglobulines
Figure
5 : Organisation
des gènes codant les chaînes lourdes d’immunoglobulines
L'organisation des gènes codant les chaînes lourdes des
immunoglobulines ressemble à celle des chaînes kappa ; elle est cependant plus complexe
puisque l'on y retrouve un groupe de gènes supplémentaires, les gènes D ou
gènes de diversité. Ce groupe de gènes est localisé entre les gènes V et les
gènes J. Les gènes D sont au nombre d’une dizaine ; cependant, comme ces gènes
sont très courts - une douzaine de paires de bases - il est difficile de
déterminer avec précision leur nombre exact.
Une autre différence importante se situe au niveau des gènes constants codant chacun des isotypes. Ces gènes sont regroupés sur environ 200kb. On trouve dans l'ordre les gènes Cm, Cd, Cg3, Cg1, Ce2, Ca1, Cg2, Cg4, Ce1, Ca2.
Le gène Ca2 est un pseudogène ; il semble qu'il y ait aussi un pseudogène Cg. Contrairement aux gènes C des chaînes légères, ils ont des introns.
L’expression des chaînes lourdes nécessite
deux recombinaisons
La première se produit entre l'un des gènes D pris au hasard et l'un des gènes J aussi pris au hasard. Une seconde recombinaison met bout à bout un gène V pris au hasard et le complexe D-J résultant de la première recombinaison. Les mécanismes impliqués dans ces recombinaisons sont les mêmes que ceux utilisés pour les chaînes kappa et lambda.
C
– Diversité jonctionnelle
Comme si la diversité créée par simple recombinaison n’était pas suffisante, la position précise à laquelle les segments génétiques V(D)J se joignent peuvent légèrement varier.
La reconnaissance des séquences heptamères-nonamères
(RSS : recombination signal sequences) par les protéines RAG-1 et
RAG-2 conduit à la coupure à bout franc de l’ADN double brin situé entre les
RSS et le brin codant adjacent. Cette coupure libère une séquence signal qui
est éliminée. Les brins codants à bout franc vont, par action des protéines
RAG, former des " épingles à cheveux " par ligation des
nucléotides terminaux de chaque brin. La ligation des brins codants nécessitera
donc la coupure de ces hairpins. Des nucléases simple brin coupent l’ADN à
proximité des hairpins. Une coupure entre les deux brins d’ADN produit un bout
franc alors qu’une coupure à distance de la région terminale du brin codant
produit une petite extension simple brin. La ligation ne pouvant être réalisée
qu’entre deux brins codants d’ADN double brin, la partie d’ADN simple brin doit
être complétée ou éliminée afin d’obtenir un segment d’ADN double brin. Ce mécanisme
est à l’origine de la P diversité. Au niveau de la liaison D-J des chaînes
lourde on peut observer une modification supplémentaire des brins codants.
Cette modification correspond à l’ajout de nucléotides, le plus souvent des G,
en 3’ du brin codant. L’ajout de ces nucléotides est effectué par une
enzyme : la terminal deoxynucleotidyl transférase (TdT) et est à l’origine
de la N diversité.
Protéines impliquées dans la diversité
jonctionnelle
Outre les protéines RAG impliquées dans la reconnaissance
des RSS, la coupure et l’élimination de la séquence signal, d’autres protéines
sont impliquées dans les réarrangements.
Les protéines Ku 70-80 se fixent aux hairpins et les
protègent des nucléases cellulaires. Le complexe DNA-PKc est une enzyme à
activité sérine-thréonine kinase qui se fixe sur les protéines Ku rendant alors
accessibles les hairpins aux nucléases. Les hairpins sont alors rapidement
coupés et joints. Les enzymes qui interviennent dans la ligation sont l’ADN
ligase IV et XRCC4.
Figure
6 : Diversité
jonctionnelle
D - Régulation de l'expression des
gènes des immunoglobulines
Les mécanismes régulant l'expression des gènes des
immunoglobulines sont moins bien connus que ceux qui sont à l'origine de leur diversité.
Comme pour tout gène eucaryote classique les niveaux possibles sont multiples
et incomplètement élucidés.
Les gènes
des lmmunoglobulines sont sensibles à la DNase 1 dans les lymphocytes
Dans les tissus non lymphoïdes, les gènes des immunoglobulines ne présentent pas de sensibilité particulière vis-à-vis de la DNase 1 et sont hyperméthylés. Dans les lymphocytes pré-B, avant toute recombinaison, les gènes codant la partie constante des chaînes m sont hypométhylés, sensibles à la DNase 1 sur les deux chromosomes bien qu'un seul soit ultérieurement utilisé. Il en est de même au moins pour les gènes des chaînes légères kappa.
Après la recombinaison V-J , des sites d'hypersensibilité vis-à-vis de la DNase 1 deviennent détectables dans les gènes des immunoglobulines des lymphocytes matures sécrétants. Ces sites sont localisés dans la partie 5' non transcrite, dans l'intron situé entre le ou les gènes J et le gène C des chaînes légères et au niveau de la séquence S (impliquée dans le switch) de la chaîne m. Ce dernier site hypersensible est retrouvé, de manière étrange, aussi bien dans les lymphocytes B que dans les T qui eux ne sécréteront jamais d'immunoglobulines. Après le switch, les gènes codant les parties constantes des autres isotypes, qui n'étaient pas sensibles vis-à-vis de la DNase 1, le deviennent.
Les modifications de structure chromatinienne, en dehors
de celles révélées par l'hypersensibilité vis-à-vis de la DNase 1, ne semblent
donc pas directement liées à une transcription immédiate du gène puisque la
plupart se produisent avant même la recombinaison. Il semble plutôt s'agir d'un
acte de différenciation en lymphocyte pré-B qui prépare le terrain à la mise en
place ultérieure de la régulation transcriptionnelle proprement dite.
Une séquence
du promoteur et une séquence stimulatrice (enhancer) située entre J et C
permettent la régulation de l'expression des gènes d’Ig.
La régulation transcriptionnelle implique à la fois des
séquences en cis et des facteurs en trans. Mais la présence de nombreux gènes,
dont un seul doit être exprimé, rend encore plus complexe la régulation. La
simple interaction entre une séquence en cis et un facteur trans ne peut pas
être suffisante, sinon tous les gènes des immunoglobulines seraient activées
simultanément. De même il n'est pas envisageable qu'il existe un facteur
régulateur spécifique de chaque gène variable. La recombinaison somatique joue
donc un rôle majeur aussi bien au niveau de la génération de la diversité qu'au
niveau de la régulation transcriptionnelle du gène ainsi sélectionné.
Chaque gène V a sa région promotrice. On en retrouve aussi
en 5’ de certains gènes D et en 5’ des régions constantes des chaînes lourdes.
On peut transcrire une région C même sans réarrangement : tous les gènes
peuvent fonctionner à priori. Ainsi, il existe une activité transcriptionnelle
des gènes V à très bas niveau avant tout réarrangement. Cette activité augmente
fortement avant le réarrangement. De même, les gènes C peuvent être transcrits
avant que la cellule ne réarrange ou ne commute ses gènes d’immunoglobulines.
L'analyse des séquences en amont des gènes variables a
montré que les gènes variables des chaînes légères sont précédés de l'octamère
ATTTGCAT alors que les gènes variables des chaînes lourdes sont, eux, précédés par
la séquence complémentaire inverse ATGCAAAT. Sur ces séquences se fixent
spécifiquement des facteurs protéiques dont un, le facteur oct-2, a été
caractérisé. Ce facteur, qui appartient à la famille POU, n'est retrouvé que
dans les lymphocytes B ; il apparaît très tôt au cours de la différenciation en
lymphocytes B (au moment de la jonction D-J). Le même octamère est susceptible
de fixer aussi le facteur oct-1 qui, lui, est ubiquitaire. Cependant,
contrairement au facteur oct-2, il n'est pas capable à lui seul d'activer la
transcription (il nécessite d'autres facteurs accessoires), ce qui explique
qu'il est sans effet dans le lymphocyte B. Ces facteurs sont indispensables à
la bonne expression aussi bien des chaînes légères que des chaînes lourdes ;
ils ne sont retrouvés que dans les cellules lymphoïdes.
Ce mécanisme régulateur spécifique de tissu, important
dans la modulation de l'expression des gènes sélectionnés, n'explique cependant
pas pourquoi le seul gène V impliqué dans la recombinaison est significativement
transcrit.
La réponse a été apportée par les expériences de délétion au sein de l'intron qui sépare les gènes J et C. De telles délétions se traduisent par un effondrement du taux de transcription montrant que cet intron contient vraisemblablement une séquence stimulatrice (enhancer). Les expériences ont montré que les sites hypersensibles vis-à-vis de la DNase 1 localisés dans cet intron, déjà évoqués au paragraphe précédent, sont localisés en 5' de cette séquence stimulatrice. La recombinaison a donc pour effet de rapprocher de cette séquence le gène sélectionné dans la partie variable qui peut alors exercer son effet sur la transcription du seul gène V recombiné. Cette séquence stimulatrice est spécifique de tissu car elle demeure sans effet lorsqu'elle est transfectée, après couplage à un gène reporter, dans une cellule autre qu'une cellule lymphoïde. Cette spécificité tissulaire résulte de l'interaction avec des protéines qui n'existent que dans les cellules lymphoïdes. L'analyse de cette séquence stimulatrice (enhancer) n'a pas permis de mettre en évidence d'homologie avec d'autres séquences stimulatrices connues. La structure de cette séquence est maintenant connue. Elle n'est pas la même dans les gènes des chaînes légères et dans les gènes des chaînes lourdes. La séquence stimulatrice des chaînes légères kappa est constituée dans l'ordre 5' vers 3' d'une séquence extinctrice silencer, d'une séquence KB et de trois séquences KE (KE1, KE2 et KE3). La séquence extinctrice semble empêcher l'expression ectopique du gène dans les cellules autres que les lymphocytes B. Son effet inhibiteur est levé dans les lymphocytes B qui possèdent un gène de chaîne légère kappa correctement réarrangé par un mécanisme non connu. La séquence KB est une séquence cis-activatrice qui fixe le facteur transcriptionnel NF-KB ; on ne sait encore rien du rôle ni du mécanisme d'action des séquences KE. La séquence stimulatrice des chaînes lourdes est constituée de 5' vers 3' des séquences mE1, mE5, mE2, p, mE3, mB, mE4 et de l'octamère retrouvé dans le promoteur. La spécificité tissulaire résulte surtout de l'interaction de facteurs avec les motifs p et mB. Les séquences E fixent des facteurs possédant des structures hélice-boucle-hélice. Lors des réarrangements, la région promotrice et l’enhancer sont rapprochés ce qui a pour effet d’augmenter la transcription des gènes V et C. Il faut maintenir la région activatrice lors du switch ce qui explique que l’enhancer soit situé en 5’ de la séquence de recombinaison Sm.